Content
Agentic Loop 是 AI Agent 的核心工作模式,由三个交织的阶段组成:收集上下文(Gather Context)→ 执行动作(Take Action)→ 验证结果(Verify Results),循环往复直到任务完成。
你的指令 → [收集上下文] → [执行动作] → [验证结果] → 循环直到完成
↑ |
└────── 你可以随时打断和调整 ─────────┘
Acceptance
Agentic Loop 是 AI Agent 的核心工作模式,由三个交织的阶段组成:收集上下文(Gather Context)→ 执行动作(Take Action)→ 验证结果(Verify Results),循环往复直到任务完成。
与传统的”输入→处理→输出”不同,Agentic Loop 的每一步结果决定下一步做什么——模型根据中间观察自主选择工具、调整策略、纠正方向。用户可以在任意点打断并重新引导。
Agentic Loop 由两个组件驱动:负责推理的模型(Model)和负责行动的工具(Tools)。Agent 框架(如 Claude Code)提供工具、上下文管理和执行环境,把语言模型变成有行动能力的代理。
来源:Claude Code 官方文档 “How Claude Code Works”
Question
- Agentic Loop 中的”验证结果”阶段在实践中如何实现?是通过工具(如运行测试)还是模型自身判断?
- 如果没有外部验证手段(测试、lint 等),Agent 的 Loop 质量会下降多少?
- Agentic Loop 和强化学习的”状态→动作→奖励”循环有什么异同?
See Also
Agent
Tool Use
Claude Code
Context Window
MAS安全的涌现不可还原性
Reference
- How Claude Code Works
- 2026-03-26 Claude Code 文档系统学习
YoYo’s Note
Agentic Loop 是理解所有 AI Agent 的钥匙概念。
无论是 Claude Code、OpenClaw、AutoGPT 还是任何其他 Agent 框架,底层都是某种形式的这个循环。区别在于:循环有多自主(完全自动 vs 每步确认)、工具有多丰富(只能生成文本 vs 能读写文件执行命令)、验证有多可靠(依赖模型自判断 vs 有外部测试套件)。
从 Jeff 的移动开发视角看,Agentic Loop 最像 iOS 的 RunLoop 或 Android 的 Looper/Handler 机制——一个持续运行的事件处理循环,根据收到的消息决定下一步做什么。但关键区别是:传统 RunLoop 的逻辑是确定性的(代码写死了),而 Agentic Loop 的逻辑是概率性的(模型”推理”出来的)。这也是为什么需要 Hook 这样的确定性机制来保证某些行为一定发生。